草庐IT

c++ - std::string 和 UTF-8 编码的 unicode

全部标签

ruby - 魔术注释(#Encoding : utf-8 ) in ruby​​ work?

ruby中的神奇注释是如何工作的?我在说:#Encoding:utf-8这是预处理指令吗?这种结构还有其他用途吗? 最佳答案 源文件顶部的Ruby解释器说明-这称为魔法注释。在处理您的源代码之前,解释器会读取这一行并设置正确的编码。我相信对于解释语言来说这很常见。至少Python使用相同的方法。您可以通过多种不同的方式指定编码(其中一些可以被编辑器识别):#encoding:UTF-8#coding:UTF-8#-*-coding:UTF-8-*-您可以在thisarticle中阅读有关源编码的一些有趣内容.我所知道的唯一具有类似结

ruby-on-rails - 将任何编码的字符串强制转换为 UTF-8

在我的Rails应用程序中,我正在使用来自世界各地的RSS提要,并且一些提要具有不在UTF-8中的链接。原始提要链接不受我控制,为了在应用程序的其他部分使用它们,它们需要采用UTF-8。如何检测编码并转换为UTF-8? 最佳答案 ruby1.9“强制”编码很容易,但是它不会转换字符,只是改变编码:str=str.force_encoding('UTF-8')str.encoding.name#=>'UTF-8'如果要进行转换,使用encode:beginstr.encode("UTF-8")rescueEncoding::Undef

Ruby - UTF-8 文件编码

我们都知道“神奇”#encoding:utf-8行。但是我已经看到了其他几种替代符号,其中一些非常疯狂。你知道或使用过这些吗?是否有一些更通用的可接受规则?编辑:好的,显然有3种方法:#encoding:UTF-8#coding:UTF-8#-*-coding:UTF-8-*-(更多信息在http://blog.grayproductions.net/articles/ruby_19s_three_default_encodings) 最佳答案 不,没有“恰好3种方式”来指定“神奇评论”——它们的数量是无限的。根据JEG2,第一行包

ruby-on-rails - rails : How to downcase non-English string?

如何在RubyonRails3中将非英语字符串小写?str="Привет"#Russianputsstr[0].ord#=>1055str.downcase!putsstr[0].ord#=>1055(Shouldbe1087)我希望它能在Ruby1.8.7和Ruby1.9.2中工作。 最佳答案 str="Привет"str.mb_chars.downcase.to_s#=>"привет" 关于ruby-on-rails-rails:Howtodowncasenon-English

Ruby 输出 Unicode 字符

我不是Ruby开发人员,但我使用Capistrano进行PHP部署。我正在尝试清理脚本的输出并尝试添加unicodecheckmark如thisblog中所述.问题是如果我这样做:checkmark="\u2713"putscheckmark它输出“\u2713”而不是✓我用谷歌搜索了一下,但找不到讨论这个问题的任何地方。TLDR:如何放置或打印unicodecheckmarkU-2713?编辑我在我的Mac(OSXLion)上运行Ruby1.8.7,所以不能使用encode方法。我的shell是iTerm2中的Bash。更新[4/8/2019]添加了引用图片以防网站出现故障。

ruby - 读取文件时如何避免被 UTF-8 BOM 绊倒

我正在使用最近添加了UnicodeBOMheader(U+FEFF)的数据提要,现在我的rake任务被它搞砸了。我可以使用file.gets[3..-1]跳过前3个字节,但是是否有更优雅的方式来读取Ruby中的文件,它可以正确处理这个问题,无论BOM是有没有? 最佳答案 在ruby​​1.9.2中,您可以使用模式r:bom|utf-8text_without_bom=nil#definethevariableoutsidetheblocktokeepthedataFile.open('file.txt',"r:bom|utf-8")

ruby-on-rails - Ruby/Rails CSV 解析,UTF-8 中的无效字节序列

我正在尝试解析从Excel电子表格生成的CSV文件。这是我的代码require'csv'file=File.open("input_file")csv=CSV.parse(file)但是我得到这个错误ArgumentError:invalidbytesequenceinUTF-8我认为错误是因为Excel将文件编码为ISO8859-1(Latin-1)而不是UTF-8谁能帮我解决这个问题提前致谢。 最佳答案 您需要告诉Ruby该文件在ISO-8859-1中。将您的文件打开行更改为:file=File.open("input_file

ruby - 使用 utf-8 编码写入和读取文件

我一直在阅读所有与UTF-8相关的问题和博客文章,并且在test.rb文件中有以下示例:#encoding:UTF-8File.open("test.txt","w")do|f|f.write"test©foo"endFile.open("test.txt","r")do|f|putsf.readend这非常有效。是在文件中正确生成©符号,并将©读回给我并将其打印在屏幕上。但是当我在我的实际项目中使用相同的代码时,我将其写入文件而不是©符号:\u00A9FWIW:我在针对我的代码运行rspec(v1.2.9)测试时得到了这个结果。规范生成一个带有©符号的文件,然后读回该文件以检查内容。

ruby - 与 String 相比,在 Ruby 中使用 StringIO 有什么优势?

什么时候使用Ruby的StringIO而不是只使用String是合适的?我想我理解它们之间的根本区别,正如“Whatisruby'sStringIOclassreally?”所强调的那样,StringIO使人们能够以面向流的方式从String读取和写入。但这实际上意味着什么?当简单地使用String不会真正削减它时,使用StringIO的实际用途的一个很好的例子是什么? 最佳答案 基本上,它使字符串看起来像一个IO对象,因此得名StringIO。StringIO类具有read和write方法,因此它可以传递给设计用于从文件或套接字读

ruby-on-rails - 如何将哈希键从 `Symbol` s 更改为 `String` s?

我正在使用RubyonRails3.2.2,我想“轻松”/“快速”将散列键从Symbol更改为String。也就是说,从{:one=>"Value1",:two=>"Value2",...}到{"one"=>"Value1","two"=>"值2",...}.我怎样才能使用尽可能少的代码来做到这一点? 最佳答案 只需调用stringify_keys(或stringify_keys!)http://apidock.com/rails/Hash/stringify_keys 关于ruby-o